Google projekt Astra, Veo a Gemini: Bitka o pokroky v AI

Updated:2024-11-28 11:08:46

Toto je Googleova odpoveď na OpenAI.

Všeobecná AI, AI, ktorá môže byť naozaj používaná denne, by bolo trápne usporiadať tlačovú konferenciu, ak to teraz nie je takto.

Ráno 15. mája oficiálne začala každoročná "Jar Gala technologického sveta" - konferencia Google I/O pre vývojárov. Koľkokrát bola umelá inteligencia spomenutá v 110-minútovej hlavnej prezentácii? Google to spočítal:

Áno, AI sa o nej hovorí každú minútu.

Súťaž generatívnej AI nedávno dosiahla nový vrchol a obsah tejto konferencie I/O sa prirodzene točí okolo umelej inteligencie.

"Pred rokom na tomto pódiu sme prvýkrát zdieľali naše plány pre natívny multimodálny veľký model, Gemini. Označilo to novú generáciu I/O," povedal generálny riaditeľ Google Sundar Pichai. "Dnes dúfame, že každý môže profitovať z technológie Gemini. Tieto prelomové funkcie preniknú do vyhľadávania, obrázkov, produktivity, systémov Android a mnohých ďalších aspektov."

Aktuálne sú k dispozícii na verejnú predpremiéru modely 1.5 Pro a 1.5 Flash, ktoré ponúkajú kontextové okno s 1 miliónom tokenov v Google AI Studio a Vertex AI. Teraz model 1.5 Pro poskytuje aj kontextové okno s 2 miliónmi tokenov pre vývojárov používajúcich API a zákazníkov Google Cloud prostredníctvom čakacej listiny.

Okrem toho bol Gemini Nano rozšírený z čisto textového vstupu na vstup obrázka. Neskôr v tomto roku, počnúc Pixelom, Google uvedie multimodálny Gemini Nano. To znamená, že mobilní používatelia môžu spracovávať nielen textový vstup, ale aj chápať viac kontextových informácií, ako sú vizuály, zvuk a hovorený jazyk.

Rodina Gemini víta nového člena: Gemini 1.5 Flash

Nový model 1.5 Flash bol optimalizovaný na rýchlosť a efektívnosť.

Nová generácia open source veľkého modelu Gemma 2

Dnes Google tiež vydal sériu aktualizácií pre open source veľký model Gemma – Gemma 2 je tu.

Ako bolo predstavené, Gemma 2 využíva novú architektúru zameranú na dosiahnutie prelomového výkonu a efektívnosti, nové open source parametre modelu sú 27B.

Pokiaľ ide o dlhé videá, Veo dokáže vytvárať videá dlhé 60 sekúnd alebo dokonca dlhšie. Môže to dosiahnuť prostredníctvom jedného podnetu alebo poskytnutím série podnetov, ktoré spolu rozprávajú príbeh. To je kľúčové pre aplikáciu modelov generovania videa vo filmovej a televíznej produkcii.

Veo je založené na práci Google v oblasti generovania vizuálneho obsahu, vrátane Generative Query Network (GQN), DVD-GAN, Image-to-Video, Phenaki, WALT, VideoPoet, Lumiere a ďalších.